package com.zzyl.common.utils;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;

import java.io.IOException;
import java.io.InputStream;

public class PDFUtil {


    public static String pdfToString(InputStream is){
        PDDocument pdDocument = null;
        try {
            // 加载PDF文档
            pdDocument = PDDocument.load(is);

            // 创建一个PDFTextStripper实例来提取文本
            PDFTextStripper pdfTextStripper = new PDFTextStripper();

            // 从PDF文档中提取文本
            return pdfTextStripper.getText(pdDocument);
        } catch (IOException e) {
            throw new RuntimeException(e);
        } finally {
            try {
                pdDocument.close();
                is.close();
            } catch (IOException e) {
                System.err.println("关闭PDF文档时发生错误: " + e.getMessage());
            }
        }
    }
}
